Problema 1: Geisers de Yellowstone

Exploración de los datos

Atributo eruptions

Tiempo de la erupción en minutos Tipo: Numérico

Atributo waiting

Tiempo entre dos erupciones en minutos

fuente: https://www.rdocumentation.org/packages/mixAK/versions/5.3/topics/Faithful

Buscamos relaciones enrte las variables

Se puede observar que existe una clara distinción en dos grupos

Modelado

Kmeans

Dbscan

Primer hacemos un dbscan "común" para comparar resultados con kmeans

Como segunda opción, podemos usar db scan para eliminar el ruido. De esta manera nos queda un gráfico mas limpio

Optics

Ploteamos los clusters obtenidos quitando el ruido

Problema 2: Problemas soporte tecnico

Un equipo de soporte técnico maneja diariamente varios tipos de problemas distintos. Algunos problemas son más frecuentes y fáciles de resolver, mientras que otros son complejos y requieren de varias llamadas telefónicas y visitas del técnico hasta que estén resueltos. Con la finalidad de optimizar el tiempo de los técnicos, la empresa desea armar equipos de trabajo a los cuales se le asignarán un conjunto de problemas de los cuales ocuparse. La empresa desea saber cuántos equipos de trabajo conformar y qué problemas va a ser asignado a cada equipo de trabajo, intentando que dichos problemas sean similares entre si, de forma tal que se pueda seleccionar los recursos humanos que mejor se ajusten a la resolución de los mismos. Se dispone de una base de datos con todos los problemas que se tratan, con información estadística sobre los mismos (issues.csv) .

Exploración de datos

Atributo PROBLEM_TYPE

Atributo Count